خوشه بندی سبک نگارش دست نوشته برون خط فارسی

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده مهندسی برق و کامپیوتر
  • نویسنده فاطمه ولایتی
  • استاد راهنما احسان اله کبیر
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1390
چکیده

هدف این پایان نامه، یافتن و استخراج ویژگی هایی است که بر مبنای آن بتوان دست خط فارسی را خوشه بندی کرد. در این کار، در ابتدا بر روی ویژگی های مبتنی بر بافت، تمرکز شده است. این ویژگی ها شامل دو دسته ویژگی آماری ماتریس باهم آیی و ویژگی مبتنی بر تبدیل گابور است. برای استخراج این ویژگی ها، یک بافت مناسب در ابعاد 1024×1024 مستقل از محتوای سند، از تصویر دستنوشته ایجاد می شود. از ویژگی های دیگری که در این کار از آن ها استفاده شده است، تعدادی ویژگی ساختاری مبتنی بر منحنی پیرامونی است. این ویژگی ها را از هر یک از تصاویر موجود در یک مجموعه داده از 97 دستنوشته فارسی که دارای متون متفاوتی بودند، استخراج کردیم و از الگوریتم k میانگین و شبکه عصبی نگاشت ویژگی خود سامان، برای خوشه بندی این ویژگی ها استفاده شده است. برای ارزیابی این ویژگی ها، یک روش ارزیابی بر مبنای الگوریتم خوشه بندی k میانگین، طراحی کرده ایم. در این الگوریتم از معیار مقایسه باینری ژاکارد استفاده کرده ایم، هم چنین برای محاسبه مراکز خوشه در هر دوره تکرار از الگوریتم k میانگین، از روش انتخاب داده چرخ رولت، بهره گرفته ایم. نتایج بدست آمده، نشان می دهد با ترکیب دو نوع از ویژگی های مبتنی بر منحنی پیرامونی، نرخ خوشه بندی، 75درصد است که نسبت به سایر روش های مورد استفاده در این کار، نرخ بهتری را در برداشته است. کلید واژه: سبک نگارش، خوشه بندی، بافت، فیلتر گابور، ماتریس با هم آیی، منحنی پیرامونی، ژاکارد، چرخ رولت ?

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تشخیص برون خط کلمات دست نوشته فارسی به کمک بلوک بندی تطبیقی

تشخیص خودکار متن یکی از زیر مجموعه های پردازش تصویر است که به طور گسترده در کتابخانه دیجیتال، خواندن آدرس پستی نامه ها، خواندن چک های بانکی، خواندن فرم ها و پرسشنامه ها استفاده می شود. بازشناسی متون دست نوشته فارسی در دو سطح کلی برون خط و بر خط انجام می پذیرد که سیستم های برون خط خود به دو دسته تقسیم می شود: سیستم های مبتنی بر جداسازی و سیستم های کلی نگر. در سیستم های مبتنی بر جداسازی سعی می ش...

بازشناسی برون خط کلمات دست نوشته فارسی در یک مجموعه ای از لغات

در این پایان نامه بازشناسی برون خط کلمات دست نوشته فارسی در یک فرهنگ لغت محدود مورد مطالعه قرار می گیرد. برای این منظور یک روش دو مرحله ای پیشنهاد می گردد. در مرحله نخست توسط الگوریتم های خوشه بندی سلسله مراتبی وisoclus کلمات موجود در فرهنگ لغت بر اساس تشابه خوشه بندی می شوند. ویژگی های تشابهی به کار رفته در این مرحله، بردارهای پروفایل بالا، پایین، پروژکشن عمودی و تعداد گذر از سیاه به سفید برای...

15 صفحه اول

بازشناسی بر خط و بدون محدودیت دست نوشته فارسی

بازشناسی برخط نوشتار یکی از دشوارترین زمینه های شناسایی الگو و هوش مصنوعی بوده و همواره مورد توجه خاص محققان قرار گرفته است. پیچیدگی این زمینه, هنگام برخورد با زبان هایی مثل فارسی و عربی که حروف آن ها باتوجه به موقعیت شان در کلمه, شکل های متفاوتی به خود می گیرند, دوچندان می شود. تحلیل دست نوشته ی فارسی یا عربی در مقایسه با زبان های لاتین، به علت حضور اجزای کوچکی ("نقطه", "دونقطه" و ...) بالا یا...

15 صفحه اول

دست نوشته های اسماعیلیان بدخشان

در دور دست‌ها ، پهلو به پهلوی چین ، باریکه سرزمینی است ،‌‌ بسیار مرتفع ، با کوه‌های آسمان بوس و به هم فشرده‌ ، با معبرهای تنگ دشوار گذر، با زمستان‌های سرد نه ‌ماهه‌ ، برخوردگاه چهار تمدن بزرگ آسیا‌: ایران‌، هند‌، چین و آسیای مرکزی که دورترین نقطه است نسبت به همه‌ی آنها و پناهگاهی است امن برای رانده‌شدگان از سراسر این سرزمین‌ها ،نه تنها کسان که حتی باورها و اندیشه‌های کهن ، نه در کنار‌هم که آمیخ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده مهندسی برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023